GJB 3180-1998 军用计算机容错要求与测评

ID

0519D1EC391C436E8F94A7CB53CA3E17

文件大小(MB)

0.65

页数:

12

文件格式:

pdf

日期:

2024-7-13

购买:

购买或下载

文本摘录(文本识别可能有误,但文件阅览显示及打印正常,pdf文件可进行文字搜索定位):

OJB,中华人民共和国国家军用标准,FL7000 GJB 3180-98,军用计算机容错要求与测评,Fault — tolerance requirement and evaluation,for military computer,1998 - 03 -16 发布1998-09-01 实施,国防科学技术工业委员会批准,中华人民共和国国家军用标准,军用计算机容错要求与测评,Fault-tolerance requirement and evaluation,for military computer,GJB 3180-98,1范围,1.1 主题内容,本标准规定了具有容错能力的军用计算机(以下简称“军用容错机”)的容错要求及其测评,准则,1.2 适用范围,本标准适用于军用容错机的研制、生产及验收等,1.3 分类,根据实际应用场合,军用容错机一般分为下列五类:,a. I类——适用于通用计算、事务处理等高可用性场合;,b. II类——适用于航天器上控制和计算的长寿命场合;,c. in类——适用于任务时间内难以维修且只能延迟维修的场合;,d. N类——适用于高性能计算对瞬时故障非常敏感的场合;,e. V类——适用于实时系统执行关键任务的高可靠高安全的场合,2引用文件,GJB 451- 90 可靠性维修性术语,GJB/Z 299A - 91 电子设备可靠性预计手册,3定义,除下列所给出的定义外,其他术语定义见GJB 451o,3. 1 失效安全 fail - safety,为了避免因系统失效导致人身、物质等灾难性后果,在设计时采取的预防措施,3.2 故障 fault,由于部件的物理失效、环境应力的作用、操作错误或不正确的设计引起系统的硬件或软件,中的错误状态,3.3 错误 error,故障在程序或数据结构中的表现。错误与故障位置之间可能存在一定距离,3.4 容错 fault tolerance,国防科学技术工业委员会1998-03-16发布1998-09-01 实施,1 1,GJB 3180-98,故障发生时,系统仍能执行规定的一组程序(或算法),或者说程序不会因系统中的故障而,终止或被修改,并且执行结果也不包含系统中故障所引起的错误,3.5 故障注入 fault injection,对军用容错机的软硬件引入实际的故障,检测系统在故障的作用下的行为状态是否符合,容错设计要求,从而对容错机制的性能进行评价,3.6 N 版本程序设计 N - version programming,多个功能相同:设计存在差异的程序段同时在容错机中运行,按照一定的决策原则(如表,决机制,门限的限制等)将正确的结果输出。N版本程序设计是一种静态冗余技术,3.7 恢复块 recovery block,采用一个主模块和多个后备模块实现相同的软件功能。主模块首先投入运行,如果检测,出其故障,经现场恢复后由一个后备模块替换上继续运行,这一过程可以重复到耗尽所有后备,模块。恢复块是一种动态冗余技术,3.8 重试 retry,一检测出错误就暂停一段时间,使被错误中断的进程卷回一次或若干次,3.9 重组 reconfiguration,当军用容错机检测出一个故障,并找到了永久失效的位置后,系统重新配置其部件取代失,效部件,或把它与系统的其他部分隔离开来,3. 10 重构 reconstruction,当军用容错机检测出一个故障,并找到了永久失效的位置后,将失效部分从系统中移出,并将修复了的或新的部件配置到系统中取代失效的部件,3. 11 恢复 recovery,军用容错机检测到故障并经重组后,使系统操作回到故障前的处理点,3. 12 检测覆盖率 fault coverage of detection,军用容错机中任意一个故障能够被检测到的概率,3.13 恢复率 recovery rate,军用容错机从故障状态成功地恢复到正常运行状态的概率,3. 14 检测时延 latency of fault detection,军用容错机从故障发生直到该故障被检测出的这段时间,4 一般要求,4.1 功能,军用容错机应具有故障检测和诊断、适当处理错误以及失效安全处理等功能,4.2 设计,进行军用容错机的设计时,应考虑军用容错机的任务使用和最终目标,根据军用计算机实,际应用的差别,确定不同的容错设计要求,4.3 测评,军用容错机除按通用计算机的规定进行检测试验外,还应采取故障注入及数学分析的方,2,GJB 3180-98,法对其容错能力进行测试和评估,5详细要求,5.1 功能,5.1.1 故障检测和诊断,系统部件应设有故障检测与诊断机制,并提供相应的故障指示信息,5.1.2 重试,对于操作不当或环境应力突然变化引起的瞬时错误,系统应进行重试,5.1.3 故障屏蔽,对于发生故障的逻辑部件或附加的外围设备,应采用隔离或校正等故障屏蔽技术来消除,故障的影响,5.1.4 重组,关键部件一般应有后援备份,以便进行失效后的切换及系统重组,5.1.5 恢复与重构,军用容错机应能在不中断运行的情况下进行重构,并使故障事件恢复正常,5.1.6 失效安全,军用容错机出现故障时,根据其任务不同,应保证出现下列结果之一:,a.仍能正确地完成规定的功能;,b.仍能正确地完成最低限度要求的功能;,c.倒回安全点停机,5.2 设计,5.2.1 原则,5.2.1.1 容错设计应尽可能对用户透明,尽量减少应用软件设计的额外开销,5.2.1.2 应根据应用需要来选择冗余范围和冗余度,重点放在影响全局可靠性的环节上,同,时要充分考虑性能价格比因素,5.2.1.3 应该考虑军用容……

……